41 research outputs found

    Due tecniche di vocoding per la sintesi di parlato emotivo mediante trasformazione del timbro vocale

    Get PDF
    In questo articolo vengono descritte due tecniche di modifica del timbro vocale utilizzate in un esperimento di trasformazione della voce con l\u27obiettivo di riprodurre alcune caratteristiche del parlato emotivo. Il segnale vocale emesso da un parlatore con stile di lettura neutro viene convertito in modo da riprodurre l\u27inviluppo spettrale utilizzato dallo stesso parlatore in una situazione emotiva non neutra. La funzione di conversione tra gli inviluppi spettrali ? calcolata utilizzando un metodo ricavato con un addestramento su dati reali. Per questo motivo ? stato preso in considerazione un database contenente la voce di un parlatore registrato durante la lettura/recitazione di un corpus di testi con diversi stili emozionali: allegro, triste e uno stile neutro di riferimento. Le due tecniche di generazione della forma d\u27onda (vocoding) prese in considerazione sono il Phase Vocoder e il filtro MLSA (Mel Log Spectrum Approximation). I due prototipi implementati sono stati valutati con test di tipo percettivo, mentre valutazioni oggettive hanno convalidato l\u27efficacia della funzione di conversione

    Cluster Analysis of Differential Spectral Envelopes on Emotional Speech

    Get PDF
    This paper reports on the analysis of the spectral variation of emotional speech. Spectral envelopes of time aligned speech frames are compared between emotionally neutral and active utterances. Statistics are computed over the resulting differential spectral envelopes for each phoneme. Finally, these statistics are classified using agglomerative hierarchical clustering and a measure of dissimilarity between statistical distributions and the resulting clusters are analysed. The results show that there are systematic changes in spectral envelopes when going from neutral to sad or happy speech, and those changes depend on the valence of the emotional content (negative, positive) as well as on the phonetic properties of the sounds such as voicing and place of articulation

    Analisi gerarchica degli inviluppi spettrali differenziali di una voce emotiva

    Get PDF
    .In questo articolo viene descritto un nuovo metodo di analisi del timbro vocale tramite lo studio delle variazioni di inviluppo spettrale utilizzato da uno stesso parlatore in situazioni emotiva neutra o espressiva. Il contesto dell\u27analisi riguarda un corpus di un solo parlatore istruito a leggere una serie di frasi utilizzando uno stile di lettura neutro e successivamente utilizzando due modalit? emotive: uno stile allegro e uno stile triste. Gli inviluppi spettrali relativi alle versioni allineate delle realizzazioni vocali neutre e espressive (allegra e triste) sono confrontati utilizzando un metodo differenziale. Le differenze sono state calcolate tra lo stato emotivo e quello neutro, di conseguenza le due categorie messe a confronto sono neutro-allegro e neutro-triste. La statistica degli inviluppi differenziali ? stata calcolata per ogni fono. I dati sono stati esaminati utilizzando un metodo di clustering gerarchico di tipo agglomerativo. I cluster risultanti sono avvalorati con diverse misure di distanza tra le distribuzioni statistiche ed esplorati visivamente per trovare similitudini e differenze tra le due categorie. I risultati mettono in evidenza sistematiche variazioni nel timbro vocale relative ai due insiemi di differenze di inviluppi spettrali. Questi tratti dipendono dalla valenza dell\u27emozione presa in considerazione (positiva, negativa) come dalle propriet? fonetiche del particolare fono come ad esempio sonorit? e luogo di articolazione

    Heat rectification through single and coupled quantum dots

    Get PDF
    We study heat rectification through quantum dots in the Coulomb blockade regime using a master equation approach. We consider both cases of two-terminal and four-terminal devices. In the two-terminal configuration, we analyze the case of a single quantum dot with either a doubly-degenerate level or two non-degenerate levels. In the sequential tunneling regime we analyze the behaviour of heat currents and rectification as functions of the position of the energy levels and of the temperature bias. In particular, we derive an upper bound for rectification in the closed-circuit setup with the doubly-degenerate level. We also prove the absence of a bound for the case of two non-degenerate levels and identify the ideal system parameters to achieve nearly perfect rectification. The second part of the paper deals with the effect of second-order cotunneling contributions, including both elastic and inelastic processes. In all cases we find that there exists ranges of values of parameters (such as the levels' position) where rectification is enhanced by cotunneling. In particular, in the doubly-degenerate level case we find that cotunneling corrections can enhance rectification when they reduce the magnitude of the heat currents. For the four-terminal configuration, we analyze the non-local situation of two Coulomb-coupled quantum dots, each connected to two terminals: the temperature bias is applied to the two terminals connected to one quantum dot, while the heat currents of interest are the ones flowing in the other quantum dot. Remarkably, in this situation we find that non-local rectification can be perfect as a consequence of the fact that the heat currents vanish for properly tuned parameters

    Towards long-term social child-robot interaction: using multi-activity switching to engage young users

    Get PDF
    Social robots have the potential to provide support in a number of practical domains, such as learning and behaviour change. This potential is particularly relevant for children, who have proven receptive to interactions with social robots. To reach learning and therapeutic goals, a number of issues need to be investigated, notably the design of an effective child-robot interaction (cHRI) to ensure the child remains engaged in the relationship and that educational goals are met. Typically, current cHRI research experiments focus on a single type of interaction activity (e.g. a game). However, these can suffer from a lack of adaptation to the child, or from an increasingly repetitive nature of the activity and interaction. In this paper, we motivate and propose a practicable solution to this issue: an adaptive robot able to switch between multiple activities within single interactions. We describe a system that embodies this idea, and present a case study in which diabetic children collaboratively learn with the robot about various aspects of managing their condition. We demonstrate the ability of our system to induce a varied interaction and show the potential of this approach both as an educational tool and as a research method for long-term cHRI

    Festival parla italiano

    No full text
    L’argomento di questo lavoro riguarda l’implementazione della versione italiana del sintetizzatore vocale da testo scritto basato sulla tecnica della concatenazione di difoni, denominato FESTIVAL . Il sistema è stato interamente realizzato utilizzando l’ambiente di sviluppo denominato EDINBURGH-SPEECH-TOOLS (EST) e un sistema di allineamento/segmentazione automatico sviluppato all’IFD sulla base di un sistema di riconoscimento fonetico per l’Italiano di elevate prestazioni. Sono descritti i vari moduli, Linguistico-Prosodici e Fonetico-Acustici, e le relative procedure utilizzate per la generazione di una nuova voce maschile adulta per l’italian